智能论文笔记

HOTCOLD Block: Fooling Thermal Infrared Detectors with a Novel Wearable Design

Hui Wei , Zhixiang Wang , Xuemei Jia , Yinqiang Zheng , Hao Tang , Shin'ichi Satoh , Zheng Wang

分类：计算机视觉

2022-12-12

Adversarial attacks on thermal infrared imaging expose the risk of related applications. Estimating the security of these systems is essential for safely deploying them in the real world. In many cases, realizing the attacks in the physical space requires elaborate special perturbations. These solutions are often \emph{impractical} and \emph{attention-grabbing}. To address the need for a physically practical and stealthy adversarial attack, we introduce \textsc{HotCold} Block, a novel physical attack for infrared detectors that hide persons utilizing the wearable Warming Paste and Cooling Paste. By attaching these readily available temperature-controlled materials to the body, \textsc{HotCold} Block evades human eyes efficiently. Moreover, unlike existing methods that build adversarial patches with complex texture and structure features, \textsc{HotCold} Block utilizes an SSP-oriented adversarial optimization algorithm that enables attacks with pure color blocks and explores the influence of size, shape, and position on attack performance. Extensive experimental results in both digital and physical environments demonstrate the performance of our proposed \textsc{HotCold} Block. \emph{Code is available: \textcolor{magenta}{https://github.com/weihui1308/HOTCOLDBlock}}.

translated by 谷歌翻译

Physical Adversarial Attack meets Computer Vision: A Decade Survey

Hui Wei , Hao Tang , Xuemei Jia , Hanxun Yu , Zhubo Li , Zhixiang Wang , Shin'ichi Satoh , Zheng Wang

分类：计算机视觉

2022-09-30

Although Deep Neural Networks (DNNs) have achieved impressive results in computer vision, their exposed vulnerability to adversarial attacks remains a serious concern. A series of works has shown that by adding elaborate perturbations to images, DNNs could have catastrophic degradation in performance metrics. And this phenomenon does not only exist in the digital space but also in the physical space. Therefore, estimating the security of these DNNs-based systems is critical for safely deploying them in the real world, especially for security-critical applications, e.g., autonomous cars, video surveillance, and medical diagnosis. In this paper, we focus on physical adversarial attacks and provide a comprehensive survey of over 150 existing papers. We first clarify the concept of the physical adversarial attack and analyze its characteristics. Then, we define the adversarial medium, essential to perform attacks in the physical world. Next, we present the physical adversarial attack methods in task order: classification, detection, and re-identification, and introduce their performance in solving the trilemma: effectiveness, stealthiness, and robustness. In the end, we discuss the current challenges and potential future directions.

translated by 谷歌翻译

MLGWSC-1: The first Machine Learning Gravitational-Wave Search Mock Data Challenge

Marlin B. Schäfer , Ondřej Zelenka , Alexander H. Nitz , He Wang , Shichao Wu , Zong-Kuan Guo , Zhoujian Cao , Zhixiang Ren , Paraskevi Nousi , Nikolaos Stergioulas

分类：机器学习

2022-09-22

我们介绍了第一个机器学习引力波搜索模拟数据挑战（MLGWSC-1）的结果。在这一挑战中，参与的小组必须从二进制黑洞合并中识别出复杂性和持续时间逐渐嵌入在逐渐更现实的噪声中的引力波信号。 4个提供的数据集中的决赛包含O3A观察的真实噪声，并发出了20秒的持续时间，其中包含进动效应和高阶模式。我们介绍了在提交前从参与者未知的1个月的测试数据中得出的6个输入算法的平均灵敏度距离和运行时。其中4个是机器学习算法。我们发现，最好的基于机器学习的算法能够以每月1个的错误警报率（FAR）的速度（FAR）实现基于匹配过滤的生产分析的敏感距离的95％。相反，对于真实的噪音，领先的机器学习搜索获得了70％。为了更高的范围，敏感距离缩小的差异缩小到某些数据集上选择机器学习提交的范围$ \ geq 200 $以优于传统搜索算法的程度。我们的结果表明，当前的机器学习搜索算法可能已经在有限的参数区域中对某些生产设置有用。为了改善最新的技术，机器学习算法需要降低他们能够检测信号并将其有效性扩展到参数空间区域的虚假警报率，在这些区域中，建模的搜索在计算上很昂贵。根据我们的发现，我们汇编了我们认为，将机器学习搜索提升到重力波信号检测中的宝贵工具，我们认为这是最重要的研究领域。

translated by 谷歌翻译

Moderately-Balanced Representation Learning for Treatment Effects with Orthogonality Information

Yiyan Huang , Cheuk Hang Leung , Shumin Ma , Qi Wu , Dongdong Wang , Zhixiang Huang

分类：机器学习 | 人工智能

2022-09-05

由于选择偏差，观察数据估算平均治疗效果（ATE）是有挑战性的。现有作品主要以两种方式应对这一挑战。一些研究人员建议构建满足正交条件的分数函数，该函数确保已建立的估计量“正交”更加健壮。其他人探索表示模型，以实现治疗组和受控群体之间的平衡表示。但是，现有研究未能进行1）在表示空间中歧视受控单元以避免过度平衡的问题； 2）充分利用“正交信息”。在本文中，我们提出了一个基于最新协变量平衡表示方法和正交机器学习理论的中等平衡的表示学习（MBRL）框架。该框架可保护表示形式免于通过多任务学习过度平衡。同时，MBRL将噪声正交性信息纳入培训和验证阶段，以实现更好的ATE估计。与现有的最新方法相比，基准和模拟数据集的全面实验表明，我们方法对治疗效应估计的优越性和鲁棒性。

translated by 谷歌翻译

Robust Causal Learning for the Estimation of Average Treatment Effects

Yiyan Huang , Cheuk Hang Leung , Xing Yan , Qi Wu , Shumin Ma , Zhiri Yuan , Dongdong Wang , Zhixiang Huang

分类： (统计)机器学习

2022-09-05

经济学和医疗保健方面的许多实际决策问题寻求从观察数据中估算平均治疗效果（ATE）。双重/辩护的机器学习（DML）是观察性研究中估计吃量的普遍方法之一。但是，DML估计器可能会遇到错误的问题，甚至在倾向分数被弄错或非常接近0或1时进行极端估计。现有文献从理论的角度解决了这个问题。在本文中，我们提出了一种健壮的因果学习（RCL）方法，以抵消DML估计量的缺陷。从理论上讲，RCL估计量i）与DML估计器一样一致且双重稳健，ii）可以摆脱错误混合问题。从经验上讲，全面的实验表明，i）RCL估计器比DML估计器给出了因果参数的稳定估计，ii）RCL估计器在模拟和基准标准数据集上应用不同的机器学习模型时，RCL估计器优于传统估计器及其变体。。

translated by 谷歌翻译

Few-Shot Class-Incremental Learning via Entropy-Regularized Data-Free Replay

Huan Liu , Li Gu , Zhixiang Chi , Yang Wang , Yuanhao Yu , Jun Chen , Jin Tang

分类：计算机视觉

2022-07-22

很少有人提出了几乎没有阶级的课程学习（FSCIL），目的是使深度学习系统能够逐步学习有限的数据。最近，一位先驱声称，通常使用的基于重播的课堂学习方法（CIL）是无效的，因此对于FSCIL而言并不是首选。如果真理，这对FSCIL领域产生了重大影响。在本文中，我们通过经验结果表明，采用数据重播非常有利。但是，存储和重播旧数据可能会导致隐私问题。为了解决此问题，我们或建议使用无数据重播，该重播可以通过发电机综合数据而无需访问真实数据。在观察知识蒸馏的不确定数据的有效性时，我们在发电机培训中强加了熵正则化，以鼓励更不确定的例子。此外，我们建议使用单速样标签重新标记生成的数据。这种修改使网络可以通过完全减少交叉渗透损失来学习，从而减轻了在常规知识蒸馏方法中平衡不同目标的问题。最后，我们对CIFAR-100，Miniimagenet和Cub-200展示了广泛的实验结果和分析，以证明我们提出的效果。

translated by 谷歌翻译

Space-based gravitational wave signal detection and extraction with deep neural network

Tianyu Zhao , Ruoxi Lyu , Zhixiang Ren , He Wang , Zhoujian Cao

分类：人工智能

2022-07-15

基于空间的重力波（GW）检测器将能够观察到来自当前基于地面检测的来源几乎不可能的信号。因此，建立的信号检测方法（匹配的过滤）将需要一个复杂的模板库，从而导致计算成本在实践中过于昂贵。在这里，我们为所有空间GW来源开发了高准确的GW信号检测和提取方法。作为概念的证明，我们表明，科学驱动和统一的多阶段深神经网络可以识别出浸入高斯噪声中的合成信号。与目标信号相比，我们的方法具有超过99％的信号检测准确性，同时获得至少95％的相似性。我们进一步证明了几种扩展场景的解释性和强烈的概括行为。

translated by 谷歌翻译

You Only Align Once: Bidirectional Interaction for Spatial-Temporal Video Super-Resolution

Mengshun Hu , Kui Jiang , Zhixiang Nie , Zheng Wang

分类：计算机视觉

2022-07-13

时空视频超分辨率（ST-VSR）技术生成具有更高分辨率和较高帧速率的高质量视频。现有的高级方法通过空间和时间视频超分辨率（S-VSR和T-VSR）的关联来完成ST-VSR任务。这些方法需要在S-VSR和T-VSR中进行两个比对和融合，这显然是冗余的，并且无法充分探索连续的空间LR帧的信息流。尽管引入了双向学习（未来到档案和过去到现场）以涵盖所有输入框架，但最终预测的直接融合无法充分利用双向运动学习和空间信息的固有相关性，并从所有框架中进行空间信息。我们提出了一个有效但有效的经常性网络，该网络具有ST-VSR的双向相互作用，其中仅需要一个对齐和融合。具体而言，它首先从未来到过去执行向后推断，然后遵循向前推理到超溶解中间帧。向后和向前的推论被分配给学习结构和详细信息，以通过联合优化简化学习任务。此外，混合融合模块（HFM）旨在汇总和提炼信息以完善空间信息并重建高质量的视频帧。在两个公共数据集上进行的广泛实验表明，我们的方法在效率方面优于最先进的方法，并将计算成本降低约22％。

translated by 谷歌翻译

Neural Global Shutter: Learn to Restore Video from a Rolling Shutter Camera with Global Reset Feature

Zhixiang Wang , Xiang Ji , Jia-Bin Huang , Shin'ichi Satoh , Xiao Zhou , Yinqiang Zheng

分类：计算机视觉

2022-04-03

大多数计算机视觉系统将无失真的图像作为输入。但是，当摄像机和对象在捕获过程中进行运动时，使用广泛使用的滚动器（RS）图像传感器会遭受几何变形。已经对纠正RS扭曲进行了广泛的研究。但是，大多数现有作品都严重依赖场景或动作的先前假设。此外，由于流动翘曲，运动估计步骤要么过于简单或计算效率低下，从而限制了它们的适用性。在本文中，我们使用全局重置功能（RSGR）使用滚动快门来恢复清洁全局快门（GS）视频。此功能使我们能够将纠正问题变成类似Deblur的问题，从而摆脱了不准确且昂贵的明确运动估计。首先，我们构建了一个捕获配对的RSGR/GS视频的光学系统。其次，我们开发了一种新型算法，该算法结合了空间和时间设计，以纠正空间变化的RSGR失真。第三，我们证明了现有的图像到图像翻译算法可以从变形的RSGR输入中恢复清洁的GS视频，但是我们的算法通过特定的设计实现了最佳性能。我们的渲染结果不仅在视觉上吸引人，而且对下游任务也有益。与最先进的RS解决方案相比，我们的RSGR解决方案在有效性和效率方面均优异。考虑到在不更改硬件的情况下很容易实现，我们相信我们的RSGR解决方案可以潜在地替代RS解决方案，以使用低噪音和低预算的无失真视频。

translated by 谷歌翻译

LightHuBERT: Lightweight and Configurable Speech Representation Learning with Once-for-All Hidden-Unit BERT

Rui Wang , Qibing Bai , Junyi Ao , Long Zhou , Zhixiang Xiong , Zhihua Wei , Yu Zhang , Tom Ko , Haizhou Li

分类：自然语言处理 | 机器学习

2022-03-29

自我监督的语音表示学习在各种语音处理任务中显示出令人鼓舞的结果。但是，预先训练的模型，例如休伯特是存储密集型变压器，限制了其在低资源设置下的应用程序范围。为此，我们建议通过修剪结构化参数自动找到所需的体系结构Lighthubert，这是一个曾经是变压器的压缩框架。更确切地说，我们创建了一个基于变压器的超级网，该超网嵌套着数千个重量共享子网，并设计了一个两阶段的蒸馏策略，以利用休伯特的上下文化潜在表示。关于自动语音识别（ASR）和出色基准的实验表明，拟议的lighthubert可实现$ 10^9 $的架构，该体系结构涉及嵌入尺寸，注意力维度，头部编号，进率向前网络比率和网络深度。 Lighthubert优于ASR上的原始Hubert和Hubert大小的五个出色的任务，在大多数任务中，在大多数任务中都具有可比的性能，并减少了29％的参数，并获得了$ 3.5 \ times $ times $ compression $压缩比在三个超级任务中，例如自动扬声器验证，关键字发现和意图分类，略有准确的损失。代码和预培训模型可在https://github.com/mechanicalsea/lighthubert上找到。

translated by 谷歌翻译